La plataforma de generación de imágenes mediante IA Midjourney, una de las grandes competidoras en este campo junto a DALL-E y Stable Diffusion, ya ha empezado a probar su cuarta versión (Midjourney v4), aún en estado 'alfa'. Recordemos que Midjourney fue la primera de las tres que estuvo disponible para el público en general (el pasado mes de marzo), y que se ha apuntado tantos como ser la primera IA en ganar un concurso de arte para humanos, la Feria Estatal de Colorado (entre polémica, por supuesto).
Ahora, sus desarrolladores sacan pecho prometiendo una versión más refinada y potente que el actual modelo v3 lanzando en agosto: "V4 se basa en un código y en una arquitectura de IA completamente nuevos", según anunció el fundador de Midjourney, David Holtz, en un anuncio de Discord, en el que también revelaba que v4 había estado entrenándose durante "más de nueve meses" en un superclúster para IA.
Midjourney v4 está siendo probado actualmente por miles de usuarios en el servidor Discord del servicio: pueden probar esta alfa indicando específicamente "–v 4" en el prompt de la imagen a generar. Usemos el modelo que usemos (v4 alfa o v3 estable), Midjourney está disponible por una tarifa de suscripción mensual que oscila entre los 10 y los 50 dólares mensuales.
¿Qué novedades ofrece esta nueva versión?
Según se ha hecho eco ArsTechnica, el aumento de detalles regulables desde el 'prompt' en esta nueva versión hace que casi sea "demasiado fácil" obtener resultados de alta calidad con instrucciones simples. También se han apreciado mejoras en la composición de las escenas y en las proporciones de los objetos de las mismas.
Según Holtz, las otras características de v4 incluyen:
- Mejor gestión de 'prompts' complejos.
- Más conocimientos (sobre criaturas, emplazamientos, etcétera).
- Mayor atención al detalle de las imágenes.
- Mejor manejo de múltiples personajes/objetos en cada escena.
- Soporte para el modificador '–chaos', pudiendo establecer un valor entre 0 y 100 para controlar la variedad de cuadrículas de imagen.
Desde Midjourney afirman que, dado que la v4 está en fase alfa, buscarán seguir mejorando algunos aspectos antes de su lanzamiento definitivo: mejorando la claridad de la imagen, reduciendo los 'artefactos de texto' (los 'textos' ilegibles que se insertan de vez en cuando en las imágenes) o agregar relaciones de aspecto personalizadas.
Imprevisto giro al fotorrealismo
Midjourney V4 is an incredible achievement - haven't been this excited about the AI synth space in like 2-3 weeks 😅
— fabians.eth (@fabianstelzer) November 5, 2022
so many worlds to explore and discover
A quick exploration of the currently leading next @SALT_VERSE location, "Bob's Quantum Pumps & Parts".. pic.twitter.com/B5ZixiyqRp
Midjourney V1 vs Midjourney V4. We've truly come a long way in 6 months! pic.twitter.com/Y5QIGEbAzF
— Weird AI Creations (@WeirdStableAI) November 7, 2022
Midjourney v4は顔のクローズアップがなかなか衝撃だと思う pic.twitter.com/kbHAz4PQnw
— やまかず (@Yamkaz) November 11, 2022
Lo que más sorprende es el giro al fotorrealismo que se aprecia en los resultados de esta nueva versión que empiezan a difundirse, sobre todo viniendo de los desarrolladores de una inteligencia artificial que, hace sólo tres meses, descartaron interés por explotar esa opción. En ese momento, Holtz explicaba su preferencia (en ese momento) por la belleza antes que por una máquina de crear 'deep fakes':
"Cuando lo estábamos optimizando, queríamos que [Midjourney] fuera hermoso, y hermoso no significa necesariamente realista. Todo lo contrario: en realidad introdujimos a propósito un sesgo que lo alejaba de las fotos. [...] Sé que esta tecnología se puede usar como una súpermáquina de deep fakes, pero no creo que el mundo necesite más fotos falsas".
Imagen | Basada en publicaciones de 'jonbristow' (vía Reddit) y de 'Cultural_Contract512' (vía Reddit)
Ver 1 comentarios